Un modèle Bayésien pour l'Agrégation des documents XML
نویسندگان
چکیده
In this paper, we are interested in aggregated search in structured XML documents. We present a structured information retrieval model based on the Bayesian networks theory. Relations query-terms and terms-elements are modeled through probability. In this model, the user’s query starts a process of propagation to recover the elements. Thus, instead of retrieving a list of elements that are likely to answer partially the user’s query, our objective is to build a virtual elements that contain relevant, non-redundant and complementary elements, that are likely to answer better the query that elements taken separatelly. We evaluated our approach using INEX 2005 collection and presented some empirical results for evaluating the impact of the aggregation approach. MOTS-CLÉS : recherche agrégée, réseaux bayésiens, redondance, complementairité.
منابع مشابه
Réseau bayésien pour un modèle de Recherche d'Information agrégée dans des documents structurés
In this paper, we are interested in aggregated search in structured XML documents. We present a model for the structured information retrieval, based on the Bayesian networks theory. Relations query-terms and terms-elements are modelled through probability measures. In this model, the user’s query starts a process of propagation to recover the relevant and noredundant elements. Thus, instead of...
متن کاملUne représentation en graphe pour l'enseignement de XML
XML est un format actuellement très utilisé. Dans le cadre des formations en informatique, il est indispensable d’initier les étudiants à ce format et, surtout, à tout son éco-système. Nous avons donc mis au point un modèle permettant d’appuyer l’enseignement de XML. Ce modèle propose de représenter un schéma XML sous la forme d’un graphe mettant en valeur les caractéristiques structurelles des...
متن کاملExploitation des connaissances d'UMLS pour la recherche d'information médicale. Vers un modèle bayésien d'indexation
RÉSUMÉ. La recherche d’information à base de connaissances est largement étudiée, mais avec peu de succès. Dans cet article, nous étudions l’impact de l’exploration d’une base de connaissance, nommée méta thésaurus UMLS pour la recherche d’information médicale. D’abord, l’indexation par concepts d’UMLS extrait dans des textes ne montre qu’une légère amélioration de MAP(Mean Average Precision) p...
متن کاملStatistical learning for image-based personalization of cardiac models. (Apprentissage statistique pour la personnalisation de modèles cardiaques à partir de données d'imagerie)
Cette thèse porte sur un problème de calibration d’un modèle électromécanique de cœur, personnalisé à partir de données d’imagerie médicale 3D + t ; et sur celui — en amont — de suivi du mouvement cardiaque. Les perspectives à long terme de la simulation personnalisée de la fonction cardiaque incluent l’aide au diagnostic et à la planification de thérapie, ainsi que la prévention des risques ca...
متن کاملOptimisation directe des poids de modèles dans un prédicteur Bayésien naïf moyenné
Résumé. Le classifieur Bayésien naïf est un outil de classification efficace en pratique pour de nombreux problèmes réels, en dépit de l’hypothèse restrictive d’indépendance des variables conditionnellement à la classe. Récemment, de nouvelles méthodes permettant d’améliorer la performance de ce classifieur ont vu le jour, sur la base à la fois de sélection de variables et de moyennage de modèl...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2011